Apprentissage de la coordination multiagent : Q-learning par jeu adaptatif

نویسنده

  • O. Gies
چکیده

Résumé : Dans le cadre de l’apprentissage multiagent, de nombreux travaux ont cherché jusqu’à présent à établir des algorithmes convergents vers un équilibre de Nash en jeux stochastiques. De tels algorithmes sont cependant limités dans la mesure où ils sont incapables de gérer la multiplicité des équilibres de Nash et de converger vers l’équilibre Pareto-optimal si celui-ci existe. Ces algorithmes utilisent généralement une convention pour la sélection de l’équilibre de Nash le plus approprié en cas d’équilibres multiples. Pour palier à cela, nous proposons un algorithme d’apprentissage étendant le Q-learning aux jeux stochastiques non-coopératifs, qui converge en jeux uniformes (en anglais “self-play”, ce sont des jeux où tous les agents utilisent le même algorithme d’apprentissage) vers l’équilibre de Nash Pareto-optimal. Nous présentons des résultats expérimentaux montrant la convergence d’un tel algorithme en jeux homogènes vers un équilibre de Nash, en tant qu’équilibre de meilleure réponse mutuelle (donc vers un équilibre de Nash Pareto-optimal), sans besoin de convention de coordination explicite.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Apprentissage de la coordination multiagent. Une méthode basée sur le Q-learning par jeu adaptatif

Current algorithmes on multiagent learning are for almost limited since they cannot manage the multiplicity of Nash equilibria and thus converge to the Pareto-optimal. To alleviate this, we propose here a learning mechanism extending the Q-learning to non-cooperative stochastique games. This learning mechanism converges to Pareto-optimal equilibria in selfplay. We present experimental results s...

متن کامل

Sous-échantillonnage topographique par apprentissage semi-supervisé

Résumé. Plusieurs aspects pourraient influencer les systèmes d’apprentissage existants. Un de ces aspects est lié au déséquilibre des classes dans lequel le nombre d’observations appartenant à une classe, dépasse fortement celui des observations dans les autres classes. Dans ce type de cas assez fréquent, le système d’apprentissage a des difficultés au cours de la phase d’entraînement liées au ...

متن کامل

Apprentissage par renforcement dans un système de filtrage adaptatif

RÉSUMÉ. Cet article présente une méthode incrémentale d’apprentissage des profils dans les systèmes de filtrage d’information. Cette méthode est basée sur le principe de renforcement. L’idée de base consiste à construire, à chaque arrivée d’un document pertinent, un profil " provisoire " permettant de sélectionner le document en question avec un score " fort ", puis intégrer ce profil, grâce à ...

متن کامل

Apprentissage Par Renforcement : Analyse Des Crit Eres Moyens Et Pond Er Es En Hori- Zon Fini

E : Les probl emes de d ecision pos es par l'optimisation stochastique en horizon ni en l'absence de mod ele peuvent ^ etre trait es par des m ethodes adaptatives. Dii erents algorithmes d'apprentissage par renforcement ont et e propos es, tels le Q-Learning ou le R-Learning, mais ils sont d eenis pour des probl emes a horizon innni. On propose ici une mod elisation en horizon ni avec une compa...

متن کامل

Apprentissage par renforcement pour la conception de systèmes multi-agents réactifs

A new reinforcement learning (RL) methodology for the design of reactive multi-agent systems is presented. Although dealing with realistic situated agents with local perception does not belong to the framework where convergence of RL algorithm is guaranted, in our method each agent learns individually its local behavior. The progressive aspect of learning, which pits the agents against more and...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2005